鲲鹏AI推理加速型

您所在的位置：网站首页 › 华为云 cloud for ai › 鲲鹏AI推理加速型

鲲鹏AI推理加速型

#鲲鹏AI推理加速型| 来源: 网络整理| 查看: 265

鲲鹏AI推理加速型云服务器是专门为AI业务提供加速服务的云服务器。搭载昇腾系列芯片及软件栈。

该类型弹性云服务器默认未开启超线程，每个vCPU对应一个底层物理内核。

鲲鹏AI推理加速型系列：搭载自研昇腾310芯片，为AI推理业务加速。

表1 鲲鹏AI推理加速型实例特点

规格名称

计算

磁盘类型

网络

鲲鹏AI推理加速增强I型kAi1s

CPU/内存配比：1:1/1:2 vCPU数量范围：4-48 处理器：鲲鹏920处理器基频：2.6GHz 高IO 通用型SSD 超高IO 极速型SSD 通用型SSD V2 超高网络收发包能力实例网络性能与计算规格对应，规格越高网络性能越强最大网络收发包：200万PPS 最大内网带宽：12Gbps 鲲鹏AI推理加速增强I型kAi1s

概述

鲲鹏AI推理加速型实例kAi1s是以昇腾310（Ascend 310）芯片为加速核心的AI加速型弹性云服务器。基于Ascend 310芯片低功耗、高算力特性，实现了能效比的大幅提升，助力AI推理业务的快速普及。通过AI推理加速型实例kAi1s将Ascend 310芯片的计算加速能力在云平台上开放出来，方便用户快速简捷地使用Ascend 310芯片强大的处理能力。

鲲鹏AI推理加速型实例kAi1s基于Atlas 300I加速卡设计，更多详细信息请参考昇腾社区。

鲲鹏AI推理加速型云服务器可用于机器视觉、语音识别、自然语言处理通用技术，支撑智能零售、智能园区、机器人云大脑、平安城市等场景。

规格

表2 kAi1s型弹性云服务器的规格

规格名称

vCPU

内存

（GiB）

最大带宽/基准带宽

最大收发包能力

（万/PPS）

网卡多队列数

网卡个数上限

Ascend 310个数

虚拟化类型

kai1s.xlarge.1

3/0.8

KVM

kai1s.2xlarge.1

4/1.5

KVM

kai1s.4xlarge.1

6/3

KVM

kai1s.3xlarge.2

8/4

100

KVM

kai1s.4xlarge.2

10/6

140

KVM

kai1s.6xlarge.2

12/8

200

KVM

kai1s.9xlarge.2

12/8

200

KVM

kai1s.12xlarge.2

12/8

200

KVM

功能

kAi1s加速型弹性云服务器功能如下：

处理器与内存配比为1:1/1:2。处理器：Kunpeng 920 2.6GHz。支持Ascend310芯片，每张Atlas 300I加速卡包含4个Ascend310芯片。单芯片半精度（FP16）8TeraFLOPS。单芯片整数精度（INT8）16TeraOPS。单芯片提供8GiB显存，内存带宽50GiB/s。内置硬件视频编解码引擎，支持H.264/265。

使用须知

kAi1s实例支持如下版本的操作系统： Ubuntu Server 18.04 64bit CentOS 7.6 64bit kAi1s型云服务器所在物理机发生故障时，云服务器支持自动恢复。

如何使用kAi1s加速型云服务器

购买与使用kAi1s加速型云服务器的流程如下：

创建云服务器，详细步骤，请参考步骤一：基础配置。在“规格”设置时，选择kAi1s加速型相关规格。在“镜像”设置时，可以选择“公共镜像”和“私有镜像”。公共镜像：已经默认安装了CANN 3.1.0的开发套件包，并配置了环境变量，请验证环境的可用性。私有镜像：需要安装驱动、固件和开发套件，并配置环境变量。详细步骤，请参考昇腾文档中心对应版本的《CANN软件安装指南》。远程登录云服务器。

对于Linux操作系统的云服务器，登录时请以SSH密码方式登录。具体操作，请参见密码方式登录Linux弹性云服务器（SSH方式）。

验证环境可用性。

请参考昇腾文档中心中对应CANN版本《应用开发指南》中的“样例使用指导”，选择一个样例进行编译运行，验证环境的正确性。

例如，选择“基于Caffe ResNet-50网络实现图片分类（图片解码+缩放+同步推理）”样例进行验证。

鲲鹏AI推理加速型

鲲鹏AI推理加速型

今日新闻

推荐新闻